clear
set more off

global ecrmen "\\intra\partages\au_amic2\SRCV_AVRIL2021\BASES_FEV2022_V5\MENAGES"
global ecrind "\\intra\partages\au_amic2\SRCV_AVRIL2021\BASES_FEV2022_V5\INDIVIDUS"
global ecrfin "\\intra\partages\au_amic2\SRCV_AVRIL2021\BASES_FEV2022_V5\TOTAL"


/**************************************************************************/
/* I - APPARIEMENT DES TABLES INDIVIDUS ET MENAGES PAR IDMENC/annee_SRCV  */
/**************************************************************************/
clear 
use "$ecrind\individus_2004_2008.dta", clear
rename men men_from_individu
save "$ecrind\individus_2004_2008_prov.dta", replace
count /* 122 742 obs et 17 var */
*keep if idmenc =="055790"
duplicates drop idmenc annee_SRCV, force
count /* 49 796 idmenc annee_SRCV */

clear
use "$ecrmen\menages_2004_2008.dta", clear 
rename men men_from_menage
save "$ecrmen\menages_2004_2008_prov.dta", replace
count /* 49 796 obs et 16 var */
*keep if idmenc =="055790"
duplicates drop idmenc annee_SRCV, force
count  /* 49 796 idmenc annee_SRCV */

clear 
use "$ecrind\individus_2004_2008_prov.dta", clear
merge m:m idmenc annee_SRCV using "$ecrmen\menages_2004_2008_prov.dta" 
drop _merge
sort idmenc annee_SRCV  
order idmenc annee_SRCV men_from_individu men_from_menage  
save "$ecrfin\ind_men_2004_2008.dta", replace

erase "$ecrind\individus_2004_2008_prov.dta"
erase "$ecrmen\menages_2004_2008_prov.dta"


/**************************************************************************************************/
/* II - REMPLACEMENT DES ZERO PAR DES POINTS DANS LES 19 VARIABLES SERVANT AU CALCUL DES AGREGATS */
/*      + LA VARIABLE HY020 SERVANT A LA COMPARAISON DANS LE PROGRAMME 4                          */
/**************************************************************************************************/

clear 
use "$ecrfin\ind_men_2004_2008.dta", clear
foreach var of varlist PY100N PY110N PY010N PY050N PY090N PY120N PY130N PY140N HY040N HY050N HY060N HY070N HY080N HY090N HY100N HY110N HY120N HY130N HY145N HY020  {
replace `var'= 0 if `var' == .
}
save "$ecrfin\ind_men_2004_2008.dta", replace 
count /* 122 742 obs. et 31 var. */


/************************************************************************/
/* III - APPLICATION DE LA CONDITION ADULTVRAIREP == 1                  */
/*      AFIN DE NE CONSERVER DANS LA TABLE QUE LES INDIVIDUS DE PLUS    */
/*      DE 16 ANS REPONDANT AU QUESTIONNAIRE                            */
/*      ON CONSERVE LES INDIVIDUS AVEC ADULTVRAIREP = 0                 */
/*      DANS UNE TABLE A PART EN VUE DE LA COMPARAISON FINALE           */
/************************************************************************/

* 1 - suppression des observations adultvrairep == 0 de la table fusionnée
clear
use "$ecrfin\ind_men_2004_2008.dta", clear
keep if adultvrairep == 1
save "$ecrfin\ind_men_2004_2008_restrict.dta", replace
count /* 95 407 obs. conservées */ 
tab age, missing

* 2 - conservation des observations adultvrairep == 0 dans une table à part en vue de la comparaison
clear
use "$ecrfin\ind_men_2004_2008.dta", clear
keep if adultvrairep == 0
count /* 27 335 obs. conservées*/
keep idmenc annee_SRCV men_from_individu men_from_menage ind adultvrairep age idindc PY010N PY050N PY100N PY090N PY110N PY130N PY120N PY140N 
drop if men_from_menage != men_from_individu
save "$ecrfin\adultvrairep_a_zero_04_08.dta", replace
count /* 27 335 obs. */


/************************************************************************/
/* IV - CALCUL DU NOMBRE D'ADULTES DE + 16 ANS COMPOSANT LE MENAGE      */
/*      PAR IDINDC IDMENC                                               */
/************************************************************************/

* 1 - nombre de idindc par idmenc
clear
use "$ecrfin\ind_men_2004_2008_restrict.dta", clear
sort idmenc annee_SRCV idindc
order idmenc idindc annee_SRCV
gen compteur = 1
order idmenc idindc annee_SRCV compteur
collapse (count) nb_idindc=compteur, by(idmenc annee_SRCV)
save "$ecrfin\nb_idindc_par_idmenc_04_08.dta", replace
count /* 49 796 */

* 2 - import du nombre de idindc par idmenc dans la table ind_men_2004_2008_restrict.dta
clear
use "$ecrfin\ind_men_2004_2008_restrict.dta", clear
merge m:m idmenc annee_SRCV using "$ecrfin\nb_idindc_par_idmenc_04_08.dta" 
*sort men ind annee_SRCV
*order men annee_SRCV ind idmenc idindc nb_idindc
sort idmenc annee_SRCV idindc
order idmenc annee_SRCV idindc men_from_menage men_from_individu ind nb_idindc
drop _merge
label variable nb_idindc			"Nombre d'individus (idindc) par menage annee_SRCV (idmenc) - calcul SAMIC"
save "$ecrfin\ind_men_2004_2008_nb.dta", replace
count /* 95 407 obs. et 32 var */


/******************************************************************************************/
/* V - VARIABLES MENAGE (H) :                                                             */
/*      PROPOSITION 1 : ON DIVISE PAR LE NOMBRE D'INDIVIDUS COMPOSANT LE MENAGE           */
/*      PROPOSITION 2 - VARIANTE : ON REPARTIT CHAQUE MONTANT EN FONCTION DU POIDS        */
/*                                 DU LABOUR_INCOME DE CHAQUE INDIVIDU DANS LE MENAGE     */
/******************************************************************************************/
/************************/
/* A - PROPOSITION 1    */
/************************/
* 1 - création des variables ménage par individu
clear
use "$ecrfin\ind_men_2004_2008_nb.dta", clear
count /* 95 407 obs. et 32 var */
foreach var of varlist HY040N HY050N HY060N HY070N HY080N HY090N HY100N HY110N HY120N HY130N HY145N {
gen P_`var'=`var'/nb_idindc
}
save "$ecrfin\ind_men_2004_2008_fin1.dta", replace
count /* 95 407 obs. et 43 var */

* 2 - labels et création de year */
clear 
use "$ecrfin\ind_men_2004_2008_fin1.dta", clear
label variable P_HY040N		"Revenu net tire de la location de propriete ou terres"
label variable P_HY050N		"Montant net redresse des alloc. famille/enfants"
label variable P_HY060N		"Montant net des alloc. d'exclusion sociale non classées ailleurs"
label variable P_HY070N		"Montant net redresse des aides au logement"
label variable P_HY080N		"Transferts nets percus entre menages (loyers, pensions)"
label variable P_HY090N		"Montant annuel net interets, div., benef. tires d'invest. en capital"
label variable P_HY100N		"Montant annuel net des remboursements interets hypothecaires"
label variable P_HY110N		"Revenus nets percus par personnes moins 16 ans"
label variable P_HY120N		"Montant net impot fortune"
label variable P_HY130N		"Montant net transfert inter-menages verses regulierement en especes"
label variable P_HY145N		"Rembours./encaissements lies a ajustement d'impot"
gen year = annee_SRCV - 1
sort ind annee_SRCV  
order ind annee_SRCV  
*sort idindc annee_SRCV idmenc 
*order idindc annee_SRCV idmenc
save "$ecrfin\ind_men_2004_2008_fin1.dta", replace
count /* 95 407 obs. et 44 var */


/*********************************/
/* B - PROPOSITION 2 : VARIANTE  */
/*********************************/

* 1 - calcul du total de labour_income par idmenc/annee
clear
use "$ecrfin\ind_men_2004_2008_fin1.dta", clear
count /* 95 407 obs. et 44 var */
*count if PY010N == . /* 0 */
*count if PY050N == . /* 0 */
gen LI = PY010N + PY050N
save "$ecrfin\ind_men_2004_2008_prov1.dta", replace


clear
use "$ecrfin\ind_men_2004_2008_prov1.dta", clear
collapse (sum) LI_idmenc_annee=LI, by(idmenc annee_SRCV)
save "$ecrfin\LI_idmenc_annee_04_08.dta", replace
count /* 49 796 obs. et 3 var */
*keep if idmenc == "055790" & annee_SRCV == 2008

* 2 - fusion de LI_idmenc_annee avec la table initiale
clear
use "$ecrfin\ind_men_2004_2008_prov1.dta", clear
count /*95 407 */
clear
use "$ecrfin\LI_idmenc_annee_04_08.dta", clear
count /* 49 796 */
clear
use "$ecrfin\ind_men_2004_2008_prov1.dta", clear
merge m:m idmenc annee_SRCV using "$ecrfin\LI_idmenc_annee_04_08.dta"
drop _merge
save "$ecrfin\ind_men_2004_2008_prov2.dta", replace 

* 3 - calcul de share_labour = LI/LI_idmenc_annee
*     calcul des 11 variables Pvar_xxxxx
clear
use "$ecrfin\ind_men_2004_2008_prov2.dta", clear
gen share_labour = LI/LI_idmenc_annee
foreach var of varlist HY040N HY050N HY060N HY070N HY080N HY090N HY100N HY110N HY120N HY130N HY145N {
gen Pvar_`var'=`var' * share_labour
}
save "$ecrfin\ind_men_2004_2008_fin2.dta", replace  

erase "$ecrfin\ind_men_2004_2008_prov1.dta"
erase "$ecrfin\ind_men_2004_2008_prov2.dta"


* 4 - remplace la suppression de 2 observations pour lesquelles "men_from_menage" est différent de "men_from_individu"*/
*     CREATION DE LA TABLE ind_men_2004_2008_fin.dta
clear 
use "$ecrfin\ind_men_2004_2008_fin2.dta", clear
sort men_from_menage ind annee_SRCV year 
order men_from_menage ind annee_SRCV year  
save "$ecrfin\ind_men_2004_2008_fin.dta", replace

* 5 - suppression de "men_from_menage" car identique à "men_from_individu" : renommé en men */
clear 
use "$ecrfin\ind_men_2004_2008_fin.dta", clear
drop men_from_menage
rename men_from_individu men
sort men ind annee_SRCV year
order men ind annee_SRCV year  
save "$ecrfin\ind_men_2004_2008_fin.dta", replace


* 6 - labels */
clear 
use "$ecrfin\ind_men_2004_2008_fin.dta", clear
label variable Pvar_HY040N		"Variante-Revenu net tire de la location de propriete ou terres"
label variable Pvar_HY050N		"Variante-Montant net redresse des alloc. famille/enfants"
label variable Pvar_HY060N		"Variante-Montant net des alloc. d'exclusion sociale non classées ailleurs"
label variable Pvar_HY070N		"Variante-Montant net redresse des aides au logement"
label variable Pvar_HY080N		"Variante-Transferts nets percus entre menages (loyers, pensions)"
label variable Pvar_HY090N		"Variante-Montant annuel net interets, div., benef. tires d'invest. en capital"
label variable Pvar_HY100N		"Variante-Montant annuel net des remboursements interets hypothecaires"
label variable Pvar_HY110N		"Variante-Revenus nets percus par personnes moins 16 ans"
label variable Pvar_HY120N		"Variante-Montant net impot fortune"
label variable Pvar_HY130N		"Variante-Montant net transfert inter-menages verses regulierement en especes"
label variable Pvar_HY145N		"Variante-Rembours./encaissements lies a ajustement d'impot"
label variable share_labour		"poids des revenus de l'individu dans le total des revenus du ménage"
save "$ecrfin\ind_men_2004_2008_fin.dta", replace
